AI资讯新闻榜单内容搜索- Claude Op

GPT-5.4 到底变强了多少？三大核心能力+电脑操控Codex上手实测！

上周，GPT-5.4 发了。意图非常明显，直指 Claude Opus4.6 和 Gemini 3.1 Pro。

来自主题: AI产品测评

7925 点击 2026-03-10 10:00

Claude两周挖出火狐浏览器22个漏洞、14个高危！安全研究的游戏规则该变了？

近日，Anthropic 公布了一组惊人的数字，在与 Mozilla 公司进行合作，测试旗下模型 Claude Opus 4.6 发现漏洞能力的过程中，两周内，就找出 Mozilla 公司「火狐」（Firefox）浏览器中 22 个不同的漏洞，其中 14 个是「高危漏洞」级别，而这几乎是 Mozilla 2025 年修复的全部「高危漏洞」的五分之一。

来自主题: AI资讯

8703 点击 2026-03-08 13:24

GLM-5 技术报告全解读｜a16z：“最好的开源模型”

a16z 昨天发了一张图，把 GLM-5 和 Claude Opus 4.6 并排标注在 Artificial Analysis Intelligence Index 的时间线上。原文的说法是： A proprietary model (Claude Opus 4.6) is still the 'most intelligent,' but the gap between

来自主题: AI技术研报

13051 点击 2026-02-22 23:06

一夜暴涨至2100亿！开源新王MiniMax M2.5，革了Opus 4.6的命

开源模型新王 MiniMax M2.5 震撼降临：M2.5 编码性能逼平 Claude Opus 4.6，价格却只有 1/20；1 美金 / 小时，这种尺寸和性能的模型，才能在算力短缺的时代不降智不卡顿，持续提供最好体验，成为最终王者！

来自主题: AI资讯

10080 点击 2026-02-15 23:30

刚刚, Claude Opus 4.6登顶编程之王! 杀入Office全家桶, 15亿打工人变天

整个硅谷又癫狂了！Anthropic深夜扔出王炸，Claude 4.6用近乎恐怖的编程能力和智能体军团，给OpenAI和谷歌上了一堂名为「降维打击」的课。

来自主题: AI资讯

11446 点击 2026-02-06 08:39

深度讨论 Gemini 3 ：Google 王者回归，LLM 新一轮排位赛猜想｜Best Ideas

最近两周的模型竞赛非常热闹：OpenAI 在 11 月 12 日发布 GPT-5.1，引入更强的推理深度与更高效的对话体验；Google 在 11 月 18 日发布 Gemini 3，全面强化多模态理解与复杂推理能力；Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5，模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。

来自主题: AI资讯

9257 点击 2025-11-28 09:27

「开发者私下更喜欢用GPT-5写代码」，Claude还坐得稳编程王座吗？

一直以来，Anthropic 的 Claude 被认为是处理编程任务的最佳模型，尤其是本月初发布的 Claude Opus 4.1，在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中，Claude Opus 4.1 相较于前代 Opus 4 又有提升，尤其在多文件代码重构方面表现出显著进步。

来自主题: AI资讯

9484 点击 2025-08-27 18:09